Inteligencia de Negocios

Maestría en Mercadeo

Sobre Mi

PhD en Estadística, MSc en Analytics & Big Data, MSc en Estadística. Con 20 años de experiencia, actual director de analítica en el CNC, miembro del comité de expertos en pobreza en el DANE y consultor de la División de Estadística de la CEPAL. Ex-decano de la Facultad de Estadística USTA, ex-director de operaciones en el ICFES, PM CEV …

Puedes encontrarme en:

Reglas del juego

  • Viernes 17 de enero, de 5:30 p.m. a 9:30 p.m.
  • Sábado 18 de enero, de 8:00 a.m. a 12:00 p.m.
  • Martes 21 de enero, de 5:30 p.m. a 9:30 p.m.
  • Viernes 24 de enero, de 5:30 p.m. a 9:30 p.m.
  • Sábado 25 de enero, de 8:00 a.m. a 12:00 p.m.
  • Martes 28 de enero, de 5:30 p.m. a 9:30 p.m.



Reglas del juego


  • Mecanismo de evaluación:

    • Proyecto precios: 35%, se permite la entrega por parejas
    • Proyecto satisfacción: 35%, se permite la entrega por parejas
    • Proyecto de tablero de control/visualización: 30%, trabajo individual



La cadena de valor de los datos

Los datos como recurso estratégico: Nuevas oportunidades, segmentos del mercado, entendimiento del consumidor

Introducción

  • Entender mejor el consumidor
  • Necesidades, expectativas
  • Quién es el consumidor
  • Cuáles son sus hábitos de consumo
  • Cuántos segmentos existen en el mercado
  • Factores relevantes en momentos de compra
  • Cuáles son los momentos del servicio que más afectan la satisfacción


Decisiones informadas

Inteligencia de negocios

El término fue acuñado por Gartner a mediados de los años 90, pero el concepto se origina en los años 70 con el comienzo de los sistemas de información gerenciales (MIS, Management Informations System). Hoy en día se implementan sistemas conocidos como:

  • CRM (Customer Relationship Management), que es un sistema diseñado para gestionar las relaciones con los clientes y mejorar las interacciones con ellos, buscando mejorar la experiencia del cliente, aumentar la lealtad y la retención, así como la optimización de procesos de ventas y marketing.

Inteligencia de negocios

El término fue acuñado por Gartner a mediados de los años 90, pero el concepto se origina en los años 70 con el comienzo de los sistemas de información gerenciales (MIS, Management Informations System). Hoy en día se implementan sistemas conocidos como:

  • ERP (Enterprise Resource Planning), es un sistema integrado que gestiona las operaciones internas de una empresa, desde finanzas hasta inventarios, buscando centralizar la información, mejorar la eficiencia operativa, reducir errores y duplicación de datos. Gobierno de datos

Inteligencia de negocios

El término fue acuñado por Gartner a mediados de los años 90, pero el concepto se origina en los años 70 con el comienzo de los sistemas de información gerenciales (MIS, Management Informations System). Hoy en día se implementan sistemas conocidos como:

  • SCM (Supply Chain Management), ayuda a gestionar y optimizar la cadena de suministro, desde el aprovisionamiento de materias primas hasta la entrega al cliente final, busca reducir costos de operación, mejorar la eficiencia logística, asegurar la calidad y disponibilidad de productos.

Inteligencia de negocios

Un sistema de inteligencia de negocios incluye herramientas y técnicas que proporcionan grandes capacidades para la transformación de los datos en conocimiento que contribuyan en la toma estratégica de decisiones que se conviertan en acciones oportunas.


INFORMACIÓN + CONVERSACIÓN + ACCIÓN = TRANSFORMACIÓN

Inteligencia de negocios

Estaremos hablando de conceptos, técnicas y herramientas que constituyen el soporte de la inteligencia de negocio y la analítica de negocios como:

  • Bases de datos
  • Metadatos
  • Data Warehouse y Data Marts
  • Data Lakes
  • Integración de datos
  • Datos estructurados y no estructurados
  • Herramientas de visualización
  • Métodos de visualización
  • Analítica de datos
  • Modelos de aprendizaje automático
  • Ciencia de datos
  • Big Data

HACÍA EL RETO BIG DATA

Transformación digital

Haz clic para ver el video

Haz clic para ver el video

Transformación digital

Transformación digital

Visión digital… repensar el negocio

Transformación digital

Abundancia de datos

Hype Cycle for Emerging Technologies

Aspectos clave: Adopción, madurez y aplicación

  • Eje X (Tiempo): Representa las etapas por las que pasa una tecnología desde su descubrimiento hasta su adopción generalizada o abandono.
  • Eje Y (Expectativas): Refleja el nivel actual de expectativas o entusiasmo en torno a esa tecnología.

Fases

  • Innovation Trigger (Desencadenante de Innovación): Marca el inicio de una tecnología emergente donde las expectativas empiezan a crecer debido a anuncios y primeros prototipos.

  • Peak of Inflated Expectations (Pico de Expectativas Infladas): La tecnología recibe una gran atención mediática, generando entusiasmo exagerado.

  • Trough of Disillusionment (Valle de Desilusión): La tecnología no cumple con las expectativas iniciales, y muchas empresas abandonan sus esfuerzos. Solo los jugadores más comprometidos continúan refinando la tecnología.

  • Slope of Enlightenment (Pendiente de Iluminación): La comprensión sobre la utilidad real de la tecnología comienza a aumentar.

  • Plateau of Productivity (Meseta de Productividad): La tecnología alcanza su madurez, demostrando beneficios concretos.

Convenciones: Gartner suele incluir una estimación del tiempo que falta para que la tecnología alcance la madurez.

Definiciones tradicionales

Definiciones tradicionales

Definiciones tradicionales

Definiciones tradicionales

Big Data se asocia con:

  • Grandes volúmenes de datos.
  • Análisis de redes sociales.
  • Datos en tiempo real.
  • Datos complejos de diferentes tipos
  • Se generan a gran velocidad.

Se requiere que las técnicas de analítica permitan descubrir información útil en tiempos razonables.

Herramientas de BI

Lenguajes, librerías y herramientas

Análisis exploratorio



  1. Tipos de variables.
  2. Visualizar los datos
  3. Identificar relaciones
  4. Datos atípicos
  5. Datos faltantes

Visualización

Requisitos

  • Instalar R y R-Studio: Ver video
  • Instalar Power BI de escritorio: Ver video
  • Instalar tableau de escritorio
  • Abra una cuenta en ChatGPT

Empecemos con R

Proceso de analítica

Wickham, H. y otros (2023)

Paquete R

  • Paquete de uso libre

  • Tiene todos los métodos que necesitamos

  • Incluye paquetes específicos para la visualización como ggplot2, Plotly, esquisse, tidyplots, etc

R logo

Etapas del proceso

Paquete estadístico

Arte de Allison Horst

R y R-Studio

Arte de Allison Horst

Trabajando en R

El entorno tidyverse

Flujo de trabajo

Ejemplo DataViz



library(pacman)
p_load(tidyverse, gganimate, gapminder, gifski, libpng, ImageMagick)

datos <- gapminder |> 
         filter(year >= 1952) |> 
         mutate(poblacion = pop / 1e6)

paises_interes <- c("Colombia", "United States", "China", "India", "Nigeria")


Explore el conjunto de datos

Ejemplo DataViz

plot <- ggplot(datos, aes(x = gdpPercap, y = lifeExp, size = poblacion, color = continent)) +
        geom_point(alpha = 0.7, show.legend = TRUE) +
        geom_text(data = datos |> filter(country %in% paises_interes), 
                  aes(label = country), size = 4, vjust = -1, hjust = 0.5, color = "black", alpha = 0.8) +
        scale_x_log10(labels = scales::dollar_format(prefix = "$")) +
        scale_y_continuous(labels = scales::comma) +
        labs(title = "Relación entre PIB per cápita y la esperanza de vida",
             subtitle = "Año: {frame_time}",
             x = "PIB per cápita (log10)",
             y = "Esperanza de vida",
             size = "Población (millones)",
             color = "Continente") +
         theme_minimal(base_size = 14) +
         theme(legend.position = "bottom") +
         transition_time(year) +
         ease_aes('linear')

#anim <- animate(plot, fps = 20, duration = 10, width = 800, height = 600, renderer = gifski_renderer())
#anim_save("gapminder_animation.gif", anim)

IA y Programación

La etapa de la frustración

Arte de Allison Horst

La IA como herramienta

Estamos en un mundo de constante evolución, ¿la IA nos va a reemplazar?

  • Enviar una carta en papel por correo
  • Pedir un domicilio por teléfono
  • Solicitar un taxi por teléfono
  • Orientarse en una ruta con un mapa de papel



@tiangolo

Imagen de Caracol Radio

GPT y Modelos LLMs

El GPT (Generative Pre-trained Transformer) es un modelo de LLM (Large Language Model). Mientras que GPT-3 usaba 175 MM de parámetros usando modelos soportados en texto, GPT-4 usa 100 BN de parámetros usando modelos soportados en texto e imágenes.

Instrucciones

No pretenda que todo ocurra en un solo paso, a veces se obtienen mejores resultados precisando un prompt en cada paso.

@mdancho84

Herramientas

  • https://rtutor.ai/
  • https://www.codeconvert.ai/r-to-python-converter
  • ChatGPT
  • Copilot
  • Gemini
  • . . .

Ejemplo

Escriba el siguiente prompt en ChatGPT y transcriba el código a R:



“use el paquete osm de R para crear un mapa y la base de datos de droguerias en bogotá, luego use mapview para visualizar las droguerias”

Necesidades de información



Necesidades de información



Velocidad, Veracidad, Variedad, …



Modelo TESLA



Modelo TESLA

Modelo TESLA

Impacto de la IA

El uso frecuente de herramientas de IA está determinando nuestras habilidades cognitivas, fenómeno llamado “descarga cognitiva”, este fenomeno afecta negativamente nuestra capacidad de pensamiento crítico. La investigación revela que los jóvenes de 17 a 25 años son los más afectados, en comparación con los mayores de 46 años.

Experiencias


  • Procesos de codificación
  • Encuestas telefónicas
  • Observatorio nutricional
  • Rating - RPD

Material recomendado

Modelos de IA generativa: https://www.futureofai.mit.edu/

  • ChatGPT
  • Stable-Diffusion & Dall-E
  • Neural Networks
  • Supervised Learning
  • Representation & Unsupervised Learning
  • Reinforcement Learning
  • Generative AI …

Material recomendado (español)


FUNDAMENTOS DEL DATA VIZ

Elementos clave

  • Tipografía: Seleccione fuentes apropiadas, limitándose a 2-3 y siendo consistente en su uso.
  • Contraste: Utilizar contraste (claro/oscuro, grande/pequeño, grueso/delgado) para resaltar y enfatizar.
  • Color: Usar el color para enfatizar o reforzar valores, evitando el uso excesivo de colores que pueda distraer.
  • Balance: Asegurar que el diseño sea visualmente equilibrado para que sea agradable y destaque la información importante.
  • Jerarquía: Proporcione pistas visuales sobre la parte más importante del mensaje.

Elementos clave

  • Despejar el gráfico: Elimine líneas, bordes y marcas de verificación innecesarias para evitar distracciones.
  • Títulos y etiquetas con propósito: Ser claro y conciso en los títulos y usar etiquetas de datos con moderación.
  • Usar el eje completo comenzando en cero para evitar malinterpretaciones de los datos.
  • Evite gráficos de pastel especialmente para comparaciones, ya que son difíciles de interpretar visualmente.

Lectura recomendada: Data Visualization Principles

De los datos a las acciones

Tipos de comunicación visual

R logo

  • Eje horizontal representa el tipo de información que se está comunicando, va desde conceptos o ideas (izq) hasta datos concretos (der).
  • Eje vertical describe la interacción que los usuarios tienen con la visualización. Las visualizaciones declarativas cuentan una historia clara, mientras que la comunicación exploratoria permite a los usuarios interactuar con los datos para llegar a sus propias interpretaciones.

Tipos de gráficos

Galerias de gráficos en R: https://r-graph-gallery.com/

Algunos ejemplos

Con el conjunto de datos artificial study realice un gráfico de cajas que presente el promedio de la variable score por cada tratamiento (asigne un color diferente a las barras según el tratamiento)


library(pacman)
p_load(tidyverse, tidyplots)

g1 <- study |> 
      tidyplot(x = treatment, y = score, color = treatment, width = 100, height = 100) |>  
      add_boxplot()

Algunos ejemplos

Ahora presente las diferencias estadísticas:


library(pacman)
p_load(tidyverse, tidyplots)

g1 <- study |> 
      tidyplot(x = treatment, y = score, color = treatment, width = 100, height = 100) |>  
      add_boxplot() |> 
      add_test_pvalue(ref.group = 1)

Algunos ejemplos

Haga un gráfico que presente el promedio del score por grupo y tipo de dosis


g2 <- study |> 
      tidyplot(x = group, y = score, color = dose, width = 100, height = 100) |>  
      add_mean_bar(alpha = 0.4) |> 
      add_mean_dash() |>  
      add_mean_value()

Business Analytics

Modelos para generar valor


Los modelos de analítica permiten una mejor planificación, tácticas y estrategias de marketing basada en información proporcionada por la dinámica del mercado.

Decisiones sobre precios

Willingness to Pay, Van Westendorp, Gabor-Granger, Newton-Miller-Smith, Conjoint Analysis…

Ejemplo: Dashboard modelo de CBC

R logo

Mostrar simulador de shiny.

Price Sensitivity Meter - PSM


El medidor de sensibilidad al precio (PSM) fue propuesto por Peter Van Westendorp (1976). La técnica permite determinar el rango de precios aceptable y el precio óptimo de los productos.


Newton, Miller y Smith (1993) ampliaron el PSM con dos preguntas de seguimiento que se pueden utilizar para generar curvas de demanda de productos y curvas de ingresos.

Metodología

La competencia debe ser evaluada con las características más similares (W, Color de luz,…)

Aplicación

Aplicación

PROYECTO 1: SENSIBILIDAD DE PRECIOS

  • VALOR: 35%
  • FECHA DE ENTREGA: Próximo XXX.
  • FORMA DE ENTREGA: PLATAFORMA

BRIEF

  • Objetivo: Determinar el rango de precio óptimo para un NUEVO producto en el mercado.

  • Target: Consumidores de la categoría

  • Cobertura: La debe especificar el estudiante.

PROYECTO 1: SENSIBILIDAD DE PRECIOS

  • Muestra: Al menos 20 respuestas (Nota máx. de 4.0). Por cada encuesta adicional se sumará 0.1.
  • Preguntas (Análisis): Mínimo agrado, intención de compra y las 4 de precios.
  • Resultados esperados: Presentación comercial (Power Point, canvas, Beamer, etc.) con ficha técnica de la investigación (Investigar), contextualización del producto, gráfico VW, rango de precios y conclusiones con recomendaciones. Debe entregar la Base de datos y el enlace con el que se realizó la encuesta.

*La estética y forma de presentación tienen una ponderación en la nota

Resumen de variables cuantitativas

Aplicación: Marketing Directo


¿Qué significa?


Es la comunicación a través de algunos medios con el fin de generar una reacción.

Aplicación: Marketing Directo

Objetivos

Ganar clientes y fomentar la fidelidad de los mismos. El objetivo de la fidelidad de los clientes puede estar dirigido a que repitan la compra o a mantener la adquisición permanente de un producto.

Metodología

Hacer un continuo seguimiento de los clientes con el fin de detectar y responder: Cómo están agrupados?. Quiénes son?. Donde están? Cuáles son los mejores? Alarmas sobre quiénes están en riesgo, etc..

Segmentación

Es el proceso de dividir una población en grupos más pequeños que tengan características y necesidades semejantes dentro de ellos y distintas entre ellos.

Se identifican grupos con alto nivel de relación para definir un plan de contactos adecuado, con el mensaje correcto, a través de canales precisos, a los clientes adecuados.

Proceso de ETL: Extracción, Transformación y Carga

Bases de datos relacionales

Estructura de datos que cumple el modelo entidad-relación (objeto–atributos).

Es un conjunto de tablas estructuradas en registros (filas) y campos (variables, columnas), que se vinculan entre sí por un campo en común (índice).

El software que gestiona la BD se denomina SGDBR–Sistema Gestor de la Base de Datos Relacional(RDBMS -Relational Data Base Management System). Ej.: PostgreSQL, Oracle, MySQL, DB2, SQL Server, Access…

Bases de datos relacionales

GRACIAS!

Referencias

  • Gutiérrez, H. A. (2009). Estrategias de muestreo: Diseño de encuestas y estimación de parámetros. Facultad de Estadística, Universidad Santo Tomás.

  • Lohr, S. L. (2021). Sampling: design and analysis. Chapman and Hall/CRC.

  • Särndal, C. E., Swensson, B., & Wretman, J. (2003). Model assisted survey sampling. Springer Science & Business Media.

  • Valliant, R., Dever, J. A., & Kreuter, F. (2013). Practical tools for designing and weighting survey samples (Vol. 1). New York: Springer.

Citación y derechos de autor

Este material ha sido creado por Giovany Babativa-Márquez y es de libre distribución bajo la licencia Creative Commons Attribution-ShareAlike 4.0.

Si se copia parcial o totalmente, debe citar la fuente como:

Babativa-Márquez, J.G. Diapositivas del curso de muestreo probabilístico. URL: https://jgbabativam.github.io/Muestreo-I/Semana1.html. 2024.